ایجاد پیکره زبانی موازی به وسیله پیکره های قیاس پذیر

پایان نامه
چکیده

امروزه پیکره های زبانی یکی از حیاتی ترین نیازها در زمینه ترجمه ماشینی می باشد. ساختار یک پیکره زبانی به این صورت است که از دو بخش تشکیل شده است. یک سمت آن را جملات زبان مبداء (در این پایان نامه زبان فارسی) و سمت دیگر آن را جملات زبان مقصد (در این پایان نامه زبان انگلیسی) تشکیل می دهد. به منظور تشکیل این پیکره زبانی ما از پایگاه دانش ویکی پدیا استفاده می کنیم. سپس یک شیوه مبتنی بر بازیابی اطلاعات که بر اساس برچسب گروه و لینک کار می کند به منظور دسته بندی مقالات مشابه استفاده می کنیم. پس از آنکه مقالات مشابه را دسته بندی کردیم، به وسیله یک سری خصیصه که در بر گیرنده ویژگی های مانند شباهت ترجمه و میزان شباهت از جهت ترازبندی می باشند برای امتیاز دهی جملات استفاده می کنیم. به منظور دادن وزن بهینه به هر یک از این خصیصه ها از یک مدل خطی استفاده کرده ایم.

منابع مشابه

پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی

Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...

متن کامل

مقایسه تطبیقی پیکره های ایستاده فتحعلی شاه قاجار به رقم مهر علی با پیکره های انسانی در هنر سغدی

مهرعلی، یکی از نگارگران عصر‌ فتحعلی‌شاه قاجار، در برخی از آثار خود، پیکره ایستاده پادشاه را با کمر باریک، شانه‏های پهن و عصای مرغ‌نشان در دست راست می‌نمایاند. سغد، از سرزمین‌های ایران باستان نیز در آثاری مانند سکه، سپر چوبی و نقاشی‌های دیواری، پیکره‌هایی مزین به جواهرات، کمر باریک، شانه‏های پهن و عصای مرغ‌نشان در دست راست معرفی می‌کند که شیوه روایی برخی از آنها متأثر از ادبیات حماسی شاهنامه است...

متن کامل

تحلیل محتوای مقالات علوم پزشکی بر اساس مطالعه پیکره زبانی

1024x768 مقدمه: تحلیل محتوا برای مقایسه یک متن با متن دیگر، آثار یک نویسنده، با نویسندگان دیگر و با همان نویسنده، مقایسه متن های نوشته شده به یک زبان طبیعی با متون زبان دیگر و بررسی متون یک حوزه تخصصی به کار می رود، هدف پژوهش حاضر تحلیل محتوای مقالات علوم پزشکی و استخراج ساختار جملات در آن به منظور استفاده پژوهشگران بوده است. روش بررسی: این مطالعه از دسته مطالعات تحلیل محتوا بر اساس ساختار دستو...

متن کامل

نقد کتاب کاربرد پیکره در تحلیل گفتمان

چکیده کاربرد پیکره در تحلیل گفتمان نوشتۀ پاول بیکر (2006) توسط انتشارات کانتینیوم (لندن و نیویورک) در 207 صفحه منتشر شده است. کتاب بر دو موضوع اصلی و ایجاد ارتباط بین آن‌ها متمرکز است: تحلیل گفتمان و زبان­شناسی پیکره­ای. تحلیل گفتمان که ماهیتی میان­رشته­ای دارد، در سال­های اخیر مورد توجه بسیاری از زبان­شناسان به‌ویژه پژوهشگران علاقه­مند به مباحث جامعه­شناسی زبان بوده است. پیکره زبانی مجموعه­ای...

متن کامل

استخراج اطلاعات از پیکره زبانی: معرفی پیکرۀ مقاله‎های علمی‎‎پژوهشی دانشگاه فردوسی مشهد

هدف: پردازش زبان طبیعی، استفاده در فرهنگ‌نگاری، پیگیری تحولات زبانی و استخراج اطلاعات زبانی خاص از مهم‌ترین کاربردهای پیکره است. هدف از انجام این پژوهش معرفی و توصیف چگونگی ساخت پیکرۀ مقاله‌های علمی‎پژوهشی است که نگارندگان پدید آورده‌اند. روش: برای ایجاد پیکره، نخست نرم‌افزار پیکره‌ساز طراحی و ساخته شد. این نرم‌افزار انواع فرمت از جمله doc،docx ،rtf ،txt ...

متن کامل

مدل سازی و پیکره بندی عوامل اثرگذار بر ایجاد اکوسیستم کارآفرینی پردیس دانشگاهی

موضوع ایجاد اکوسیستم کارآفرینی پردیس دانشگاهی، یکی از چالش‌های پیشِ روی سیاست‌گذران توسعه کارآفرینی در نظام آموزش عالی محسوب می‌شود. هدف اصلی این پژوهش، مدل‌سازی و پیکره‌بندی عوامل اثرگذار بر ایجاد اکوسیستم کارآفرینانه پردیس دانشگاهی، از طریق سطح‌بندی و تعیین میزان شدت تعاملات آن‌هاست. براین اساس روش تحقیق این پژوهش از لحاظ هدف، کاربردی و از منظر گردآوری اطلاعات، آمیخته-اکتشافی است. این پژوهش دا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023